Mots audio-visuels joints pour la détection de scènes violentes dans les vidéos
نویسندگان
چکیده
This paper presents an audio-visual data representation for violent scenes detection in Hollywood movies. Existing works in this field consider either the audio or the visual information; or their shallow fusion. None has yet explored their joint dependence for violent scenes detection. We propose a feature which provides strong multimodal audio and visual cues by first joining the audio and the visual features and then revealing statistically the joint multimodal patterns. Experimental validation was conducted in the context of the “Violent Scenes Detection” task of the MediaEval 2013 Multimedia benchmark. The obtained results show the potential of the proposed approach in comparison to methods using audio and visual feature separately and other fusion methods. MOTS-CLÉS : Indéxation sémantique, Analyse de contenu, Fusion audio-visuelle, Multimédia, MediaEval.
منابع مشابه
Hierarchical Screen-Space Indirect Illumination for Video Games
Indirect lighting accounts for subtle but essential effects in virtual scenes, and plays a great role in our perception of geometry. It is especially wanted in video games, on fully dynamic scenes, where it greatly enhances the perceived realism. In this paper, we present a screen-space hierarchical algorithm for computing indirect lighting for animated scenes. Our algorithm is fully compatible...
متن کاملA Fast Deferred Shading Pipeline for Real Time Approximate Indirect Illumination
In this paper, we present a deferred shading algorithm for computing iapproximate screen-space multi-bounce indirect illumination with visibility, in real time. For each frame, we compute mipmapped G-Buffers of depth, normals, illumination and voxelized geometry. To each mipmap level we apply a single shader that gathers screen-space illumination using local Monte-Carlo integration. We upsample...
متن کاملClassification des actions humaines basée sur les descripteurs spatio-temporels
Résumé. Dans cet article, nous proposons un nouveau descripteur spatio-temporel appelé ST-SURF pour l’analyse et la reconnaissance d’actions dans des flux vidéo. L’idée principale est d’enrichir le descripteur Speed Up Robust Feature (SURF) en intégrant l’information de mouvement issue du flot optique. Seuls les points d’intérêts qui ont subi un déplacement sont pris en compte pour générer un d...
متن کاملA Method for Detecting Artificial Objects in Natural Environments
Résumé Dans cet article nous allons présenter une méthode pour la détection automatique d’objets artificiels dans des images numériques représentant des milieux naturels. Cette méthode est basée sur la distribution statistique des motifs de texture dans l’image. Cette distribution est calculée en utilisant la loi de Zipf. L’image est divisée en imagettes et la distribution de Zipf est calculée ...
متن کاملAnalyse de Programmes Malveillants par Abstraction de Comportements. (Analysis of Malware by Behavior Abstraction)
ion de Comportements par Réécriture de Mots Nous avons vu, en Section 1.2, que l’analyse comportementale classique opérait directement au niveau des interactions observées (les appels de librairie, les appels systèmes...), ce qui rend la détection de comportements suspects peu robuste puisque la moindre modification dans la mise en œuvre d’une fonctionnalité permet de faire échouer la détection...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2014